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摘要 : [目的 /意义 ] 融 合 可 解释 性 结果 的 数据 故事 化 方法 为 解决 数据 认 知 困难 、 预 测 结果 难以 


要 素 元 组 给 出 数据 故事 映射 流程 ， 
据 故 事 化 模型 设计 的 理论 指导 下 ， 


合 解释 结果 与 故事 化 模型 要 素 的 交互 框架 , 并 通过 案例 研究 验证 数 所 


理解 以 及 模型 决策 可 信 度 低 等 问题 提供 了 新 策 
技术 的 解释 形式 、 数 据 故 事 的 叙事 结构 以 及 目前 数 和 
性 理论 与 数据 故事 化 实现 模式 构建 了 “析出 一 可 


咯 。[ 方 法 /过 程 ] 梳 到 


国人 民 大 学 ) ， 北 京 ，100872; 2 中 国人 民 


了 模型 无 关 局 部 可 解释 性 


中 故事 化 研究 中 采用 的 方法 ， 基 于 可 解释 
组 一 叙事 ”的 数据 故事 化 模型 ， 利 用 定义 的 


明确 了 实现 故事 化 模型 设计 的 关键 技术 。[ 结 果 / 结 论 ] 在 数 


本 研究 提出 面向 解释 结果 的 “扇形 ”故事 化 实现 路 径 和 融 


故事 化 方法 在 结果 解释 


方面 的 实用 价值 。 通过 构建 基于 可 解释 性 结果 的 数据 故事 化 方法 体系 框架 , 为 扩展 具备 数据 


感知 与 认 知 、 可 辅助 智能 决策 功能 的 故事 化 路 径 提 


新 思路 。 
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1 引言 /Introduction 


洞 见 呈 现 和 结果 解释 是 大 数据 时 代 两 个 重要 的 有 
可 理解 的 方式 向 用 户 呈 现 、 交 流 和 传递 是 
技术 相 结合 为 解决 上 述 问题 、 提 升 数据 认 知 条 


完 方向 , 如 何 将 数据 分 析 及 解释 结果 以 
个 值得 探究 的 问题 。 数 据 故 事 化 方法 与 可 解释 性 


[支持 决策 提供 了 新 方案 。 一 方面 ,基于 可 解释 


性 技术 对 复杂 模型 结果 进行 解释 , 要 求 非 专 业 人 士 理 解 模 型 决策 的 运作 原理 , 但 由 于 非 专 业 
人 士 缺 乏 特定 领域 的 专业 知识 , 使 得 仅 依靠 可 解释 性 技术 辅助 的 算法 模型 难以 取得 非 专业 人 


故事 化 具有 易于 记忆 、 认 知 和 体验 的 特点 , 通 
决定 中， 而 传统 数据 故事 化 侧重 于 呈现 数据 分 析 结 果 ， 在 此 基 而 


士 的 信任 ,而 借助 故事 化 方法 呈现 解释 结果 更 易于 非 技 术 背 景 的 受众 理解 。 男 一 方面 ， 数 据 
过 生成 一 个 通俗 易 懂 的 数据 故事 帮助 用 户 做 出 
上 通过 引入 可 解释 性 技术 揭 


示 模 型 决策 原因 ， 增加 了 数据 故事 的 深度 与 应 用 价值 。 因 此, 将 可 解释 性 结果 以 数据 故事 形 


式 进行 呈现 可 实现 双方 优势 互补 ， 既 保留 了 可 解释 性 技术 增强 透明 度 与 便于 调试 的 优势 , 也 


体现 数据 故事 化 叙述 方式 易于 理解 、 


基于 现 有 文献 分 析 ， 目 前 对 


等 方面 02345， 对 于 数据 故事 化 方法 的 
法 是 一 种 旨 在 探索 数据 洞 见 、 实 现 上 


交互 性 强 的 特点 。 
于 数据 故事 化 的 研究 多 聚焦 在 概念 、 流 程 、 模 型 或 结构 、 应 


究 方法 帆 。 该 数据 故事 化 方法 在 涉及 任何 需要 解释 生 
解释 ) 的 预测 结果 、 并 与 非 技术 受众 沟通 的 场景 中 应 用 广泛 ， 如 人 金融 领域 的 信用 评分 解释 、 


完 仍 处 于 探索 阶段 。 本 研究 提出 的 数据 故事 化 方 


度 简 化 等 不 足 。 为 解决 上 述 问 题 ， 


医疗 领域 的 疾病 预测 解释 、 电 商 平台 的 顾客 行 


AW. 现 有 的 数据 故事 化 方法 存在 故事 主观 性 较 强 、 与 领 


E 


昌 数 据 感 知 到 数据 认 知 的 过 渡 、 辅 助 决策 制定 的 通用 性 研 
E 意 模型 《模型 无 关 ) 对 单 样本 点 (局 部 


为 分 析 以 及 教育 领域 的 课程 推荐 系统 等 。 分 析 


上 受众 至 


宽 数 据 故事 与 专业 知识 的 融合 路 径 ; 并 且 , 现 有 的 数据 故事 化 方法 因 
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域 知识 融 合 度 不 够 、 重 要 信息 被 过 
在 故事 生成 中 通过 引入 基于 数据 和 模型 行为 的 客观 解释 结 
果 ， 而 不 是 叙述 者 的 主观 判断 ， 有 利于 提高 故事 的 客观 性 和 可 靠 
可 解释 性 结果 转化 为 易于 理解 的 数据 故事 , 能够 帮助 非 专 ， 


“Es 此外， 将 模型 无 关 局 部 
解数 据 分析 结 果 , 进而 拓 
过 度 简化 而 丢失 重要 信 


其 于 数据 科学 的 信息 资源 名 


Er TE 
EE 


研究 范式 创新 ”项 目 编 


(Jin Qingwen: PhD student, E-mail: 


Rh. 局 部 可 解释 性 结果 通过 展示 模型 行为 与 决策 依据 ,保留 了 更 多 的 复杂 度 和 重要 细节 ， 确 


保 故 事 的 可 访问 性 。 


由 此 可 见 , 融合 可 解释 性 技术 的 数据 故事 化 方法 有 助 于 充分 发 挥 其 挖掘 


数据 洞察 、 增 强 数 据 理解 和 提供 深层 次 认 知 的 作用 ， 从 而 实现 传达 、 解 释 、 说 服 或 吸引 目标 


受众 的 目的 器。 


为 探索 在 数据 故事 化 方法 中 解释 结果 与 叙事 结构 的 融合 路 径 , 本 研究 梳理 了 模型 无 关 局 


部 可 解释 性 结果 的 呈现 形式 、 数 据 故 事 的 叙事 结构 以 及 现 有 的 数据 故事 化 方法 等 内 容 ,并 从 


数据 故事 化 模型 视角 入 手 ， 对 “本 


交互 融合 框架 ， 并 通过 “银行 贷款 信用 


可 用 性 。 


2 相关 研究 /Relevant research 


本 研究 致力 于 实现 模型 无 关 


一 重组 一 叙事 ”故事 化 模型 要 素 进行 定义 、 表 示 ， 提 出 
基于 要 素 元 组 的 数据 故事 映射 流程 ， 讨 论 分 析 了 面向 解释 结果 的 “扇形 ”故事 化 实现 路 径 和 


风险 预测 ”案例 验证 提出 的 数据 故事 化 方法 及 模型 的 


局 部 可 解释 性 结果 与 数据 故事 化 模型 二 者 的 融合 : 首先 根据 


模型 信息 及 解释 结果 内 容 提取 关键 数据 , 并 将 其 与 数据 故事 化 模型 要 素 匹 配 , 然后 基于 故事 


目标 和 用 户 行为 i 


部 分 重点 对 模型 无 关 


行 数据 事件 的 情景 化 排序 ， 最 后 实现 解释 结果 的 故事 化 叙述 。 鉴 于 此 ， 本 


局 部 可 解释 性 结果 的 呈现 形式 、 数 据 故事 的 叙事 结构 以 及 现 有 的 数据 故 


事 化 方法 等 内 容 展开 研究 。 


2.1 模型 无 关 局 部 可 解释 性 结果 的 呈现 形式 
在 可 解释 性 机 器 学 习 中 , “模型 无 关 ” 与 “局 部 解释 ”分 别 是 指 “ 面 向 任何 模型 "和 “ 角 
释 单个 样本 点 ”Dl。 模 型 无 关 局 部 可 解释 性 方法 能 够 解释 单 样本 点 在 任意 模型 中 的 预测 结 


则 在 帮助 用 户 理解 并 信任 模型 决策 。 不 同 的 可 解释 性 方法 输出 的 结果 形式 具有 差异 性 , 如 特 
征 重要 性 分 数 、 特 征 权重 列表 、 解 释 愧 


模型 无 关 局 部 
可 解释 性 技术 


特征 重要 性 分 
jr 


E 


FE 规则 和 可 视 化 图 表 等 ， 如 表 1 所 示 。 


表 1 不 同 的 模型 无 关 局 部 可 解释 性 结果 的 呈现 形式 
Table 1 The Presentation Form of Different Model-agnostic Local Interpretability Results 


解释 形式 


T 文献 
计算 每 个 特征 的 Shapley 值 ， 按 
影响 程度 排序 ， 正 值 (红色 ) X [8] 
示 预 测 向 右 增 加 ， 而 负 值 〈 赣 


色 ) 表示 预测 向 左 减少 。 


局 部 代理 模型 


于 LIME 方法 给 出 对 孤岛 检测 
型 的 决策 贡献 最 大 的 前 6 个 特 [9] 
量 ， 得 到 其 特征 权重 列表 。 


EX xk Rat 


in 


局 部 扰动 方法 


对 原始 图 像 超 像素 干扰 ， 并 计算 
其 在 不 同 隐 藏 层 的 影响 得 分 ， 帮 。 [10] 
助 识别 最 有 影响 力 的 训练 图 像 。 


b w . = 采用 部 分 依赖 图 (PDP, 红色 线 ) 
和 中 心 个 体 条 件 期 望 Cc-ICE, 黑 
x T 
DM p" 一 a) 图 识别 输入 变量 和 模型 输 。 【1 
出 之 间 关 系 的 方向 。 
样本 点 x 有 A、B 两 条 路 径 穿 过 
"M 决策 边界 来 改变 预测 结果 (有效 
aaa 反 事实 ) ， 但 A 路 径 是 最 短 的 ， 0 
即 最 小 反 事实 。 
R's anchor= (length. of. stay > 8.00 & 基于 Anchor 规则 解释 “再 犯罪 预 
CR Lime Atom | ， 测 模型 ”的 输出 结果 ， 显 示 监 管 
规则 推理 c_charge_degree = F & sex = Male & 年 限 大 于 8 年 ， 且 年 龄 在 25~31 [13] 
days_b_screening_arrest < 1.00 & 25 EM 
<age31 &2< prion comt<5 & | MWIRRSERYL, AGER 
is_violent_recid = 1) target > High} 3 B JË 率 o 
en 使 用 基于 分 层 相关 性 传播 的 方法 
可 视 化 缺陷 图 像 ， 将 模型 拟 合 到 
VRETE y 14 
nie 决策 树 中 ， 并 将 预测 结果 转换 为 ”【 “| 
人 类 可 解释 的 文本 。 

综 上 分 析 , 模型 无 关 局 部 可 解释 性 技术 的 解释 形式 因 技 术 差 异 而 有 所 不 同 , 这 些 技术 在 
增强 模型 的 透明 度 和 辅助 用 户 理解 模型 的 决策 行为 方面 发 挥 着 重要 作用 。 然而 , 绝 大 多 数 的 
解释 是 基于 特征 问 量 的 维度 来 阐释 模型 的 输出 , 这 意味 着 理解 这 些 解释 结果 往往 需要 相应 的 
领域 知识 和 专业 技能 ， 对 于 非 专 业 用 户 而 言 并 不 友好 。 相 较 于 传统 的 解释 形式 , 采用 数据 故 
事 化 的 方式 来 呈现 和 传达 解释 结果 , 不 仅 能 够 为 用 户 提 供 更 加 丰富 直观 的 数据 洞察 ,还 能 在 
提升 数据 理解 和 结果 解释 的 有 效 性 方面 带 来 显著 优势 。 这 种 以 用 户 为 中 心 的 故事 化 呈现 手 


Bt, 弥补 了 传统 可 解释 


达 的 新 途径， 展现 了 其 独特 的 研究 和 应 用 价值 。 


2.2 数据 故事 


Y MES 


TH 


Hh 


[15], 


突 、 


以 及 Dykes 的 数据 叙事 弧 模 型 08， 
的 成 长 和 变革 旅 和 
重 问 题解 决 的 叙事 策略 。 这 些 研究 展示 了 数据 故事 叙 寻 
JPM S| J 


at 


盖 故 事 的 开端 、 
内 容 由 包括 人 物 、 


在 探索 数据 故事 叙事 结构 的 下 
需求 。 例 如 ，Segel E fll Heer J 7 
平衡 了 创作 者 意 


解决 方案 ”0 


旅 ”09 强调 个 人 


叙事 结构 

构建 数据 故事 依托 两 个 核心 元 素 : 叙 事 
架 ” 和 “肌肉 ”的 角色 。 
发 


事 结 构 负责 

和 结尾 等 关键 

在 内 的 
究 中 ， 


a 
高 潮 、 
情感 和 对 评 


EH 


HE. 
情节 、 


多 种 叙事 杠 


阶段 ， 为 故事 提供 清 
核心 元 素 所 1 


介绍 的 马 提 


Ey 


M 


则 在 通过 叙事 让 


告 激 励 微型 
专注 于 通过 数据 故事 好 
T, M Hoey 的 “问题 一 解决 方案 ”模式 P01 提供 了 一 种 注 


图 和 观众 探索 的 需求 。Yuan STD 等 采用 
企业 的 服务 


结构 、 互 动 演示 幻灯 
的 三 幕 式 结构 “背景 阐述 、 


W 


1TH 


释 性 技术 对 非 专业 用 户 不 够 友好 的 短 板 , 开辟 了 加 强 数据 理解 和 结果 传 


结构 和 故事 内 容 , 它们 分 别 扮演 着 数据 故事 的 “ 骨 
搭建 故事 框架 ， 确 保 故 事 沿 着 一 个 明确 的 路 径 展 开 ， 
的 脉络 。 与 此 同时 ， 故 


AF, 


赋予 故事 以 情感 和 深度 
架 被 提出 以 适应 不 同 的 叙事 目的 和 观众 
结构 和 向 下 钻 取 结 构 


冲 


业务 决策 


ka] 


有 结构 的 多 样 化 和 丰富 性 , dH 


情感 


< 鸣 和 问题 导向 情节 发 展 的 习 


E 要 性 。 


创新 。Freytag 的 金字 塔 结 


构 [ [17] 


. Campbell 的 “英雄 


E GER 


不 同 的 叙事 结构 根据 其 框架 、 目 标 和 


目标 受众 差异 , 有 着 各 自 的 特点 和 应 用 场景 , 如 “问题 一 解决 方案 ”模式 适合 聚焦 问题 


解决 ， 


而 “英雄 之 旅 ”框架 则 更 侧重 于 描绘 个 人 的 成 长 和 变革 故事 。 这 些 多 角度 的 叙事 结构 为 数据 
故事 提供 了 丰富 的 表现 形式 和 深度 ， 确 保 每 个 故事 都 能 以 最 适合 其 内 容 和 目的 的 方式 呈现 。 


2.3 现 有 的 数据 故事 化 方法 研究 


在 探索 数据 故事 化 方法 中 ， 本 研究 从 故事 流 方向 、 分 段 式 故事 
四 个 维度 进行 深入 分 析 ， 如 表 2 Br. 〈1) 对 故事 流 方 向 的 分 析 揭 示 了 数 
核心 方法 : 创作 者 目标 驱动 、 受 众 行为 驱动 、 以 及 创作 者 与 受众 
了 一 个 重要 的 洞 见 , 即 有 效 的 数据 故事 化 需要 平衡 创作 者 的 意图 
思想 指导 着 本 研究 数据 故事 化 实现 模式 的 创建 ， 既 和 
起 受众 的 兴趣 和 情感 共鸣 。 (2) 分 段 式 故事 描述 的 方法 论 为 本 研究 的 实现 模式 提供 
上 的 支持 。 通 过 将 故事 化 过 程 划分 为 不 同 阶 段 ， 如 “ 建 模 一 生成 一 呈现 ”或 “解构 一 重 
ME”, 本 研究 采纳 了 类 似 的 分 段 逻辑 。 这 种 分 段 方法 不 仅 有 助 于 系统 地 从 可 解释 
提取 关键 要 素 , 而 且 通 过 重组 这 些 元 素 ， 以 及 采 上 月 


Wo G) 对 组 成 要 素 的 分 析 强 调 了 匹配 数据 


分 析 结 果 与 故事 要 素 的 重要 性 ， 以 及 将 故事 要 


述 、 组 成 要 素 和 时 间 等 


角 保 故事 既 符 合 创 


恰当 的 叙事 结构 ， 能 够 有 效 地 呈现 数据 洞 


素 有 序 排列 的 必要 性 。 本 研究 的 故事 化 模式 采用 析 昌 
(4) 从 时 


辑 、 叙 述 故事 的 结构 ， 正 好 体现 了 这 一 点 。 


HERA. 8 


中 的 作用 ， 特 别 是 在 需要 考虑 事件 顺序 和 情感 发 展 的 情境 中 。 


表 2 数据 故事 化 方法 分 类 及 应 用 


Table 2 Classification and Application of Data Storytelling Methods 


分 析 维 度 。 ”故事 化 方法 ”故事 模型 /结构 


SPSN 模型 


Er 


应 用 案例 
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(3) 基于 可 解释 性 结果 “析出 ”结果 特征 
LIME 输出 结果 可 为 故事 化 模型 提供 关于 预测 结果 概率 值 、 关 键 特 行 
值 等 要 素 的 支持 。 由 LIME 算法 输出 的 特征 列表 如 表 3 所 示 。 


表 3 LIME 算法 输出 的 特征 权重 列表 
Table 3 List of Feature Weights Output by the LIME Algorithm 


特征 值 范 围 
0 CreditCardDebt <= 0.37 
1 Address <= 3.00 
2 3.00 < YearsOfService <= 7.00 
3 8.50 < DebtRatio <= 13.90 
LIME 预测 概率 值 : [0.281117] 
原 模 型 预测 概率 : [0.292807] 


由 表 3 可 知 , 相 较 于 原始 模型 ,基于 LIME f 
好 的 拟 合 度 , 并 且 给 出 了 关键 特征 对 于 预测 结果 影 


得 期 望 结果 至 关 重 要 ， 权 重 正 负 代 表 对 预测 结 
(4) 基于 结果 特征 重组 故事 要 素 


法 训练 的 代理 


本 点 分 布 


IKA 


特征 权重 
-0.162433 
0.084595 
0.076309 
-0.007021 


F 值 、 解 释 特 征 权 重 


于 预测 结果 为 "1 的 样本 


模型 在 结果 预测 方面 具有 恨 


影响 的 积极 或 消极 作用 。 


基于 32 部 分 对 要 素 元 组 的 定义 与 表示 ， 在 析出 结果 特征 的 前 提 下 ， 将 | 


本 ) 在 模型 中 的 特征 及 解释 结果 重组 为 故事 要 素 ， 要 素 对 应 情况 可 表示 为 “ 


{“ 工 作 年 限 为 4 年 、 


响 的 权重 大 小 , 这 对 于 调整 特征 方向 以 获 


]Pu 0 号 样 


住址 特征 值 为 0、 债务 收入 比率 为 9.7、 信 用 债务 比率 为 0.2、 预 


WERK” > “AW” , “EW CreditCardDebt 可 使 预测 概率 更 接近 原 模型 ” >“ 行为 ”， 


“CreditCardDebt 权重 为 -0.162433、Address (i 


EE 为 0.084595” 人 “变动 


依据 ” 


“与 期 望 目 


FREE SAN 0.011690” > [RJ BY 

(5) 基于 故事 要 素 实 现 叙事 
重组 故事 要 素 有 助 于 明确 故事 背景 、 目 标 、 人 物 、 事 件 和 情节 ， 基 于 对 用 户 u 的 要 素 元 
组 表示 ,依据 样本 特征 值 变 化 构建 特定 人 物 的 事件 树 ， 即 由 一 组 事件 及 其 关系 组 成 ， 在 事件 
树 上 赋予 相应 的 故事 标识 则 生成 了 一 个 数据 故事 。 以 用 户 v 为 代表 的 数据 故事 树 如 图 8 所 示 ， 
故事 背景 是 用 户 炎 的 预测 结果 为 [0.292807]， 基 于 LIME 算法 的 局 部 预测 结果 为 [0.281117]， 故 
事 目 标 为 以 故事 化 方式 对 产生 该 预测 结果 的 原因 进行 解释 , 具体 操作 方法 是 依据 LIME 特征 
权重 列表 依次 添加 关键 特征 ， 观 察 特 征 添 加 后 的 预测 结果 与 用 户 v 的 预测 结果 的 差距 ， 距 离 
缩小 说 明 特 征 贡献 度 为 正 向 。 树 的 深度 由 关键 特征 的 个 数 决定 , 如 0 号 样本 的 关键 特征 数 为 
4， 故 显示 4 层 树 ;， 树 的 每 个 分 支 划 分 依据 样本 特征 权重 大 小 和 特征 值 在 该 列 特 征 的 分 布 范 
围 ， 特 征 权重 大 的 具有 优先 划分 权 。 图 中 红线 标识 了 解释 算法 对 于 0 号 样本 的 解释 过 程 ， 结 
果 可 知 , 随 着 关键 特征 的 增加 , 其 距离 竺 解释 样本 的 距离 逐渐 缩小 , 由 样本 0 一 一 事件 1-1 一 
一 事件 2-1 一 一 事件 3-2 一 一 事件 4-2 组 成 的 一 系列 故事 点 即 构成 面向 用 户 v 的 一 个 故事 情 
节 ， 也 可 看 作 最 简单 的 数据 故事 。 


ae 


故事 目标 


DebtRatio<=8.50 
样本 距离 : «mn (#8) 
DebtRatio» 13.90 


8.50<DebtRatio<=13.90 


样本 距离 :0.027708 


3.00<YearsOfService<=7.00 
样本 距离 : 0.040017 
YearsOfService<=3.00 
样本 距离 ，0.030758 e 
nC 
样本 距离 ，0.109609 
Address<=3.00 


样本 距离 ，0.040623 Address>3.00 样本 距离 : 0.032758 


CreditCardDebt<=0.37 


故事 背景 : 已 知 预测 结 
Rn E MEE 页 测 © CreditCardDebt>0.37 样本 距离 ，0.059596 


主人 公 人 物 信息 : 
YearsOfService: 4 
Address: 0 
DebtRatio: 9.7 
CreditCardDebt: 0.2 
预测 概率 ，0.292807 


图 8 用 户 w (0 号 样本 ) 主导 下 的 数据 故事 树 
Figure 8 Data Story Tree Led by User u (Sample 0) 


CP) mann 0.063039 


样本 距离 0.012720 


2s 


由 图 8 可 知 , 各 个 特征 范围 对 于 预测 结果 有 具有 不 同 的 贡献 度 , 随 着 不 同 重要 性 程度 的 特 
征 加 入 模型 预测 中 ， 其 与 初始 样本 点 的 距离 逐渐 缩小 ， 直 至 达到 0.011690, 说 明 可 解释 性 结 
果 与 原 模型 预测 结果 具有 良好 的 保 真 度 。 图 8 仅 展 示 了 单个 样本 点 (故事 主角 ) 的 故事 化 解 
释 过 程 ， 进 一 步 推理 可 知 ， 若 要 对 多 个 人 物 的 故事 化 过 程 进 行星 现 则 可 组 成 故事 森林 ， 故 事 
森林 的 树 与 树 之 间 保 持 一 定 的 联系 。 每 个 故事 树 由 多 个 逻辑 上 相连 的 事件 组 成 ,从 根 节点 到 
叶子 节点 单条 路 径 上 的 事件 序列 组 成 了 一 个 情节 或 故事 , 可 以 看 出 故事 情节 是 对 故事 发 展 中 
重要 事件 的 合理 映射 ， 并 从 特征 变化 的 角度 解释 事件 之 间 的 关系 。 由 案例 分 析 结 果 可 知 ， 本 


zn 


究 提 出 的 数据 故事 化 方法 ,包括 故事 化 模型 、 实 现 路 径 和 交互 融合 框架 ,在 面 对 任 意 模 型 
中 单一 样本 点 的 结果 解释 时 是 切实 可 行 的 ， 且 具有 良好 的 交互 体验 和 泛 化 能 
5 结论 /Conclusion 

本 研究 提出 了 一 种 新 颖 的 数据 故事 化 方法 , 则 在 桥接 模型 无 关 的 局 部 可 解释 性 结果 与 数 
据 故 事 化 之 间 的 缺口 。 通 过 将 复杂 的 解释 结果 转换 成 包含 深刻 洞察 的 故事 ,本 方法 融合 了 关 
键 特征 解释 与 叙事 结构 ， 集 成 数据 可 视 化 、 数 据 分 析 、 故 事 化 建 模 、 自 然 语言 生成 及 故事 呈 
现 等 多 种 技术 ， 以 更 有 效 地 传递 数据 信息 、 阅 释 预测 结果 ， 并 与 受众 共享 知识 。 此 方法 的 研 
究 价 值 在 于 CD 填补 了 研究 空白 : 针对 数据 故事 化 方法 的 探索 不 足 ， 构 建 了 可 解释 性 理 
论 6 与 数据 故事 化 理论 支撑 的 数据 故事 化 模型 型 , 从 而 加 强 模型 无 关 局 部 可 解释 性 结果 与 数据 故 
SUBE. OD 创新 了 故事 生成 模型 : 通过 开发 “析出 一 重组 一 叙事 ”的 数据 故事 生成 
框架 ， 有 效 地 实现 了 从 解释 结果 到 故事 要 素 的 转化 ， 为 叙述 构建 提供 结构 化 框架 。 G) TR 
索 了 “ 户 形 ”故事 化 实现 路 径 : 提出 一 条 基于 可 解释 性 结果 的 故事 化 实现 路 径 ， 并 通过 实际 数 
据 集 的 应 用 验证 了 该 路 径 和 故事 化 方法 的 有 效 性 。 

尽管 该 研究 在 数据 故事 化 领域 取得 了 显著 进展 , 但 仍 存在 挑战 , 特别 是 在 可 解释 性 结果 
的 数据 要 素 提 取 方 法 和 故事 树 的 自动 化 生成 方面 需要 进一步 优化 。 未 来 研究 将 重点 关 广 这 些 
领域 的 深入 探究 及 故事 化 模型 的 评价 研究 ， 以 期 不 断 提升 数据 故事 化 方法 的 准确 性 、 效 率 和 
户 体 验 。 通 过 这 些 努 力 ， 本 研究 由 在 为 数据 科学 家 提供 强大 工具 ， 以 通俗 易 懂 的 方式 解释 
复杂 数据 ， 为 决策 者 和 故事 受众 揭示 数据 背后 的 故事 和 洞察 。 
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Abstract: [Purpose/Significance] The data storytelling method of integrating interpretability 
results provides a new strategy to solve the problems of difficult data cognition, difficult to 
understand prediction results and low reliability of model decision-making. [Method/Process] This 
paper summarizes the interpretation form of model-agnostic local interpretability technology, the 
narrative structure of data stories and the methods used in the current research on data storytelling. 
Based on the interpretability theory and the realization mode of data storytelling, a data storytelling 
model of "extraction-reorganization-narrative" is constructed, and the data story mapping process 
is given by using the defined element tuple. The key techniques of story model design are introduced 
briefly. [Result/Conclusion] Under the theoretical guidance of data storytelling model design, this 
paper proposes a "fan-shaped" storytelling implementation path for interpretation results and an 
interactive framework that integrates the elements of interpretation results and storytelling model, 
and reflects the practical value of data storytelling method in result interpretation through case 


studies. A framework of data storytelling methods based on interpretable results is constructed, 
which provides new ideas for expanding storytelling paths with data perception and cognition and 
assisting intelligent decision-making. 

Keywords: data storytelling; interpretability; model-agnostic; local interpretability; narrative 


